## Opções iniciais de configuração do ambiente --------------
knitr::opts_chunk$set(echo = TRUE)
options(scipen=999)
#### --------------------------------------------------------
library("stringr") # funções de manipulação de chars
library("dplyr") # gramática de wrangling
library("ggplot2") # apresentação gráfica
library("tibble") # data sets melhorados
library("magrittr") # semantica serializada de instruções
library("readxl") # leitor de arquivos excel
library("purrr") # programação funcional
library("knitr") # Uso de tabelas Kable para apresentação
#### --------------------------------------------------------
v_path_i <- "~/RGitRep/Tese MIDxPT/Dados originais/" ## Caminho para leitura de arquivos de input
v_path_o <- "~/RGitRep/Tese MIDxPT/Analises/" ## Caminho para geração de arquivos de output
v_path_inter <- "~/RGitRep/Tese MIDxPT/Resultados intermediarios/" ## Caminho para geração de arquivos intermediariosLeitura de planilhas e criação de datasets para programas e projetos-PPG. Filtro de projetos com início de 2013 em diante. Também nesta etapa foi realizada a criação de dataset com as categorias utilizadas na apresentação dos dados (ds_prg).
ds_prgppg <- read_excel(paste0(v_path_i, "Programas PPG 2016.xlsx"))
ds_prjppg <- read_excel(paste0(v_path_i, "Projetos PPG 2016.xlsx"))
ds_siglas <- read_excel(paste0(v_path_i, "Siglas áreas de avaliação.xlsx")) %>%
select(nome = "Nome área de avaliação",
sigla = "Sigla")
ds_prg <- ds_prgppg %>% merge(., ds_siglas, by.x = "NM_AREA_AVALIACAO", by.y = "nome") %>% # Incluindo sigla
select(CD_PROGRAMA_IES,
NM_AREA_AVALIACAO,
SG_AREA_AVALIACAO = sigla,
CS_STATUS_JURIDICO,
DS_DEPENDENCIA_ADMINISTRATIVA,
ANO_INICIO_PROGRAMA,
NM_MODALIDADE_PROGRAMA,
CD_CONCEITO_PROGRAMA,
NM_REGIAO, # Novas categorias
SG_UF_PROGRAMA, #
SG_ENTIDADE_ENSINO, #
NM_PROGRAMA_IES, #
NM_GRAU_PROGRAMA)
write.csv2(ds_prg, paste0(v_path_inter, "ds_prg.csv"))
ds_prjppg_13_16 <- ds_prjppg %>%
mutate(ANO_PRJ = str_sub(.$DH_INICIO, 1, 4)) %>%
filter(ANO_PRJ >= 2013)
write.csv2(ds_prjppg_13_16, paste0(v_path_inter, "ds_prjppg_13_16.csv"))
rm(ds_prjppg) ## Limpeza de memóriaLeitura de planilhas e criação de datasets com dados de membros de projetos entre 2013 e 2016.
f.membros <- function(file){
ds <- read_excel(file) %>%
arrange(DS_TIPO_MEMBRO) %>%
filter(DS_TIPO_MEMBRO %in% c("DISCENTE","DOCENTE")) %>%
merge(., ds_prjppg_13_16, by = "ID_PROJETO")
return(ds)
}
ds_membros_13_16 <- rbind(f.membros(paste0(v_path_i, "Membros dos projetos 2013.xlsx")),
f.membros(paste0(v_path_i, "Membros dos projetos 2014.xlsx")),
f.membros(paste0(v_path_i, "Membros dos projetos 2015.xlsx")),
f.membros(paste0(v_path_i, "Membros dos projetos 2016.xlsx")))
write.csv2(ds_membros_13_16, paste0(v_path_inter, "ds_membros_13_16.csv"))Leitura de planilhas e criação de datasets para dados de formação de professores e alunos nos programas de mestrado e doutorado. Os campos comuns foram selecionados e padronizados para os três arquivos para facilitar relacionamento com indicadores.
v_form_campos <- c("nro_id_cnpq", "seq_pessoa_fisica",
"nome_sucupira", "nome_cvlattes",
"nome_filtro_cvlattes", "sgl_instituicao",
"nme_instituicao", "cod_programa",
"nme_programa", "nme_area_avaliacao",
"seq_area_basica", "area_basica",
"grande_area_basica", "nro_nota_doutorado",
"nro_nota_mestrado", "nro_nota_mestrado_prof",
"dta_fim", "seq_tipo_categoria_vinculo",
"nivel_formacao", "ano_inicio_formacao",
"ano_fim_formacao", "formacao_concluida",
"sigla_pais_ies_formacao", "sigla_uf_ies_formacao",
"sigla_ies_formacao", "nome_ies_formacao",
"nome_curso_formacao", "cod_area_curso_formacao",
"grande_area_curso_formacao", "area_curso_formacao")
ds_frmdic <- read_excel(paste0(v_path_i, "Formação dos discentes 2013-2016 - Tese.xlsx")) %>%
mutate(nro_id_cnpq = str_pad(as.character(nro_id_cnpq),
width = 16,
side = "left",
pad = "0"),
seq_pessoa_fisica = as.character(seq_pessoa_fisica)) %>%
select(v_form_campos) %>%
mutate(doc_ou_disc = "DISCENTE")
write.csv2(ds_frmdic, paste0(v_path_inter, "ds_frmdic.csv"))
ds_frmdic_mestrado <- read_excel(paste0(v_path_i, "Dicentes mestrado tratada -tese.xlsx")) %>%
mutate(nro_id_cnpq = str_pad(as.character(nro_id_cnpq),
width = 16,
side = "left",
pad = "0"),
seq_pessoa_fisica = as.character(seq_pessoa_fisica)) %>%
select(v_form_campos) %>%
mutate(doc_ou_disc = "DISCENTE")
write.csv2(ds_frmdic_mestrado, paste0(v_path_inter, "ds_frmdic_mestrado.csv"))
ds_frmdoc <- read_excel(paste0(v_path_i, "Formação dos docentes tese.xlsx")) %>%
select(v_form_campos) %>%
mutate(doc_ou_disc = "DOCENTE")
write.csv2(ds_frmdoc, paste0(v_path_inter, "ds_frmdoc.csv"))Preparação, transformações e calculo de variáveis e indicadores que compõe o IMI - Indice de Multi/Inter disciplinaridade.
Variáveis:
QPPP: Quantidade de professores permanentes do programa
QFDPD: Quantidade das formações dos docentes permanentes no grau de doutorado
QFDPM: Quantidade das formações dos docentes permanentes no grau de mestrado
QFDPG: Quantidade das formações dos docentes permanentes no grau de graduação
Indicadores:
DFDDo: Diversidade de formação do docente pelo grau de doutorado
DFDM: Diversidade de formação do docente pelo grau de mestrado
DFDG: Diversidade de formação do docente pelo grau de graduação
OBS - Os agrupamentos e sumarizações abaixo são realizados em dois estágios progressivos para garantir contagens adequadas no calculo das variáveis.
ds_IMI1_QPPP <- ds_frmdoc %>%
group_by(cod_programa, nome_filtro_cvlattes) %>%
summarise(QT = n()) %>%
group_by(cod_programa) %>%
summarise(QPPP = n())
write.csv2(ds_IMI1_QPPP, paste0(v_path_inter, "ds_IMI1_QPPP.csv"))
ds_IMI1_QFDPD <- ds_frmdoc %>%
filter(nivel_formacao == "Doutorado") %>%
group_by(cod_programa, nome_curso_formacao) %>%
summarise(QT = n()) %>%
group_by(cod_programa) %>%
summarise(QFDPD = n())
write.csv2(ds_IMI1_QFDPD, paste0(v_path_inter, "ds_IMI1_QFDPD.csv"))
ds_IMI1_QFDPM <- ds_frmdoc %>%
filter(nivel_formacao == "Mestrado") %>%
group_by(cod_programa, nome_curso_formacao) %>%
summarise(QT = n()) %>%
group_by(cod_programa) %>%
summarise(QFDPM = n())
write.csv2(ds_IMI1_QFDPM, paste0(v_path_inter, "ds_IMI1_QFDPM.csv"))
ds_IMI1_QFDPG <- ds_frmdoc %>%
filter(nivel_formacao == "Graduação") %>%
group_by(cod_programa, nome_curso_formacao) %>%
summarise(QT = n()) %>%
group_by(cod_programa) %>%
summarise(QFDPG = n())
write.csv2(ds_IMI1_QFDPG, paste0(v_path_inter, "ds_IMI1_QFDPG.csv"))
ds_IMI1_FCDo <- merge(ds_IMI1_QFDPD, ds_IMI1_QFDPM, by = "cod_programa", all.x = T) %>%
merge(., ds_IMI1_QFDPG, by = "cod_programa", all.x = T) %>%
merge(., ds_IMI1_QPPP, by = "cod_programa", all.x = T) %>%
mutate(DFDDo = QFDPD/QPPP,
DFDM = QFDPM/QPPP,
DFDG = QFDPG/QPPP) %>% ## Fórmulas dos indicadores
#mutate(DFDDo = ifelse(DFDDo <= 1, DFDDo, 1),
# DFDM = ifelse(DFDM <= 1, DFDM, 1),
# DFDG = ifelse(DFDG <= 1, DFDG, 1)) %>% ## Limpeza de ocorrências acima de 1.0
mutate(FCDo = (DFDDo + DFDM + DFDG)/3) %>% ## Fórmula do constructo
merge(ds_prg, ., by.x = "CD_PROGRAMA_IES", by.y = "cod_programa", all.y = T) ## Categorias
write.csv2(ds_IMI1_FCDo, paste0(v_path_o, "FCDo.csv"))
kable(ds_IMI1_FCDo[1:12, ]) #c(1,8:15)]) ## Amostra do arquivo gerado acima, sem as categorias| CD_PROGRAMA_IES | NM_AREA_AVALIACAO | SG_AREA_AVALIACAO | CS_STATUS_JURIDICO | DS_DEPENDENCIA_ADMINISTRATIVA | ANO_INICIO_PROGRAMA | NM_MODALIDADE_PROGRAMA | CD_CONCEITO_PROGRAMA | NM_REGIAO | SG_UF_PROGRAMA | SG_ENTIDADE_ENSINO | NM_PROGRAMA_IES | NM_GRAU_PROGRAMA | QFDPD | QFDPM | QFDPG | QPPP | DFDDo | DFDM | DFDG | FCDo |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10001018002P1 | CIÊNCIAS BIOLÓGICAS III | CBIII | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 3 | NORTE | RO | UNIR | BIOLOGIA EXPERIMENTAL | MESTRADO/DOUTORADO | 10 | 7 | 7 | 15 | 0.6666667 | 0.4666667 | 0.4666667 | 0.5333333 |
| 10001018004P4 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 1999 | ACADÊMICO | 4 | NORTE | RO | UNIR | DESENVOLVIMENTO REGIONAL E MEIO AMBIENTE | MESTRADO/DOUTORADO | 13 | 13 | 11 | 15 | 0.8666667 | 0.8666667 | 0.7333333 | 0.8222222 |
| 10001018005P0 | GEOGRAFIA | GEOG | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | GEOGRAFIA | MESTRADO/DOUTORADO | 5 | 6 | 4 | 15 | 0.3333333 | 0.4000000 | 0.2666667 | 0.3333333 |
| 10001018006P7 | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | ADM | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | ADMINISTRAÇÃO | MESTRADO | 7 | 5 | 6 | 9 | 0.7777778 | 0.5555556 | 0.6666667 | 0.6666667 |
| 10001018009P6 | PSICOLOGIA | PSICO | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | RO | UNIR | PSICOLOGIA | MESTRADO | 4 | 4 | 5 | 10 | 0.4000000 | 0.4000000 | 0.5000000 | 0.4333333 |
| 10001018010P4 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | LETRAS | MESTRADO | 10 | 5 | 6 | 15 | 0.6666667 | 0.3333333 | 0.4000000 | 0.4666667 |
| 10001018011P0 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | EDUCAÇÃO | MESTRADO | 5 | 6 | 10 | 11 | 0.4545455 | 0.5454545 | 0.9090909 | 0.6363636 |
| 10001018012P7 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2011 | ACADÊMICO | 3 | NORTE | RO | UNIR | ESTUDOS LITERÁRIOS | MESTRADO | 10 | 8 | 7 | 14 | 0.7142857 | 0.5714286 | 0.5000000 | 0.5952381 |
| 10001018016P2 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2014 | PROFISSIONAL | 3 | NORTE | RO | UNIR | EDUCAÇÃO ESCOLAR | MESTRADO PROFISSIONAL | 5 | 10 | 10 | 17 | 0.2941176 | 0.5882353 | 0.5882353 | 0.4901961 |
| 10001018017P9 | CIÊNCIAS AMBIENTAIS | CAMB | FEDERAL | PÚBLICA | 2013 | ACADÊMICO | 3 | NORTE | RO | UNIR | CIÊNCIAS AMBIENTAIS | MESTRADO | 10 | 12 | 10 | 15 | 0.6666667 | 0.8000000 | 0.6666667 | 0.7111111 |
| 10001018039P2 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 10 | 11 | 11 | 14 | 0.7142857 | 0.7857143 | 0.7857143 | 0.7619048 |
| 10001018040P0 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 9 | 11 | 10 | 12 | 0.7500000 | 0.9166667 | 0.8333333 | 0.8333333 |
Variáveis:
QFGDi: Quantidade das formações dos discentes no grau de graduação
QDP: Quantidade de discentes do programa
Indicadores:
DFGDi: Diversidade de formação do discente pelo grau de graduação
ds_frmdic_ttl <- rbind(ds_frmdic, ds_frmdic_mestrado) %>%
filter(nivel_formacao == "Graduação") %>%
group_by(cod_programa,
nome_filtro_cvlattes,
doc_ou_disc,
nome_curso_formacao) %>%
summarise(QT = n()) ## Junção de formações de discentes e filtro de graduação
write.csv2(ds_frmdic_ttl, paste0(v_path_inter, "ds_frmdic_ttl.csv"))
ds_IMI2_QDP <- ds_frmdic_ttl %>%
group_by(cod_programa, nome_filtro_cvlattes) %>%
summarise(QT = n()) %>%
group_by(cod_programa) %>%
summarise(QDP = n())
write.csv2(ds_IMI2_QDP, paste0(v_path_inter, "ds_IMI2_QDP.csv"))
ds_IMI2_QFGDi <- ds_frmdic_ttl %>%
group_by(cod_programa, nome_curso_formacao) %>%
summarise(QT = n()) %>%
group_by(cod_programa) %>%
summarise(QFGDi = n())
write.csv2(ds_IMI2_QFGDi, paste0(v_path_inter, "ds_IMI2_QFGDi.csv"))
ds_IMI2_FCDi <- merge(ds_IMI2_QFGDi, ds_IMI2_QDP, by = "cod_programa", all.x = T) %>%
mutate(DFGDi = QFGDi/QDP) %>% ## Fórmula do indicador
#mutate(DFGDi = ifelse(DFGDi <= 1, DFGDi, 1)) %>% ## Limpeza de ocorrências acima de 1.0
mutate(FCDi = DFGDi) %>% ## Fórmula do constructo
merge(ds_prg, ., by.x = "CD_PROGRAMA_IES", by.y = "cod_programa", all.y = T) ## Categorias
write.csv2(ds_IMI2_FCDi, paste0(v_path_o, "FCDi.csv"))
kable(ds_IMI2_FCDi[1:12, ]) #c(1,8:11)]) ## Amostra do arquivo gerado acima, sem as categorias| CD_PROGRAMA_IES | NM_AREA_AVALIACAO | SG_AREA_AVALIACAO | CS_STATUS_JURIDICO | DS_DEPENDENCIA_ADMINISTRATIVA | ANO_INICIO_PROGRAMA | NM_MODALIDADE_PROGRAMA | CD_CONCEITO_PROGRAMA | NM_REGIAO | SG_UF_PROGRAMA | SG_ENTIDADE_ENSINO | NM_PROGRAMA_IES | NM_GRAU_PROGRAMA | QFGDi | QDP | DFGDi | FCDi |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10001018002P1 | CIÊNCIAS BIOLÓGICAS III | CBIII | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 3 | NORTE | RO | UNIR | BIOLOGIA EXPERIMENTAL | MESTRADO/DOUTORADO | 8 | 29 | 0.2758621 | 0.2758621 |
| 10001018004P4 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 1999 | ACADÊMICO | 4 | NORTE | RO | UNIR | DESENVOLVIMENTO REGIONAL E MEIO AMBIENTE | MESTRADO/DOUTORADO | 25 | 41 | 0.6097561 | 0.6097561 |
| 10001018005P0 | GEOGRAFIA | GEOG | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | GEOGRAFIA | MESTRADO/DOUTORADO | 23 | 42 | 0.5476190 | 0.5476190 |
| 10001018006P7 | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | ADM | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | ADMINISTRAÇÃO | MESTRADO | 22 | 48 | 0.4583333 | 0.4583333 |
| 10001018009P6 | PSICOLOGIA | PSICO | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | RO | UNIR | PSICOLOGIA | MESTRADO | 21 | 52 | 0.4038462 | 0.4038462 |
| 10001018010P4 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | LETRAS | MESTRADO | 31 | 73 | 0.4246575 | 0.4246575 |
| 10001018011P0 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | EDUCAÇÃO | MESTRADO | 25 | 63 | 0.3968254 | 0.3968254 |
| 10001018012P7 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2011 | ACADÊMICO | 3 | NORTE | RO | UNIR | ESTUDOS LITERÁRIOS | MESTRADO | 31 | 46 | 0.6739130 | 0.6739130 |
| 10001018016P2 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2014 | PROFISSIONAL | 3 | NORTE | RO | UNIR | EDUCAÇÃO ESCOLAR | MESTRADO PROFISSIONAL | 26 | 54 | 0.4814815 | 0.4814815 |
| 10001018017P9 | CIÊNCIAS AMBIENTAIS | CAMB | FEDERAL | PÚBLICA | 2013 | ACADÊMICO | 3 | NORTE | RO | UNIR | CIÊNCIAS AMBIENTAIS | MESTRADO | 37 | 55 | 0.6727273 | 0.6727273 |
| 10001018039P2 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 24 | 42 | 0.5714286 | 0.5714286 |
| 10001018040P0 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 12 | 12 | 1.0000000 | 1.0000000 |
Variáveis:
QIP: Quantidade de instituições participantes nos projetos
QPP: Quantidade de projetos no programa
ds_fin <- rbind(read_excel(paste0(v_path_i, "Financiadores de proejtos 2013.xlsx")),
read_excel(paste0(v_path_i, "Financiadores de projetos 2014.xlsx")),
read_excel(paste0(v_path_i, "Financiadores de projetos 2015.xlsx")),
read_excel(paste0(v_path_i, "Financiadores de proejtos 2016.xlsx"))) ## Carga de Instituições
ds_IMI3_QIP <- ds_fin %>%
group_by(CD_PROGRAMA_IES, NM_FINANCIADOR) %>%
summarise(QT = n()) %>%
group_by(CD_PROGRAMA_IES) %>%
summarise(QIP = n())
write.csv2(ds_IMI3_QIP, paste0(v_path_inter, "ds_IMI3_QIP.csv"))
ds_IMI3_QPP <- ds_fin %>%
group_by(CD_PROGRAMA_IES, ID_PROJETO) %>%
summarise(QT = n()) %>%
group_by(CD_PROGRAMA_IES) %>%
summarise(QPP = n())
write.csv2(ds_IMI3_QPP, paste0(v_path_inter, "ds_IMI3_QPP.csv"))Variáveis:
DFPP: Diversidade formações dos participantes dos projetos (graduação).
QMP: Quantidade de membros dos projetos
Indicadores:
DFCP: Diversidade de formações que colaboram por meio de projetos
OBS - As variáveis e indicadores abaixo são consolidadas no nível de projeto e depois sumarizadas por média em programas para possibilitar cruzamento com demais constructos.
ds_formacao_grd <- rbind(ds_frmdic, ds_frmdoc, ds_frmdic_mestrado) %>%
filter(nivel_formacao == "Graduação") %>%
group_by(cod_programa,
nome_filtro_cvlattes,
doc_ou_disc,
nome_curso_formacao) %>%
summarise(QT = n()) ## Junção de formações de todos os membros e filtro de graduação
write.csv2(ds_formacao_grd, paste0(v_path_inter, "ds_formacao_grd.csv"))
ds_MbrPrj_grd <- merge(ds_membros_13_16, ds_formacao_grd,
by.x = c("CD_PROGRAMA_IES", "NM_MEMBRO_PROJETO", "DS_TIPO_MEMBRO"),
by.y = c("cod_programa", "nome_filtro_cvlattes", "doc_ou_disc")) #@ Junção de
## membros e formações
write.csv2(ds_MbrPrj_grd, paste0(v_path_inter, "ds_MbrPrj_grd.csv"))
ds_IMI3_DFPP <- ds_MbrPrj_grd %>%
group_by(CD_PROGRAMA_IES, ID_PROJETO, nome_curso_formacao) %>%
summarise(QT = n()) %>%
group_by(CD_PROGRAMA_IES, ID_PROJETO) %>%
summarise(DFPP = n())
write.csv2(ds_IMI3_DFPP, paste0(v_path_inter, "ds_IMI3_DFPP.csv"))
ds_IMI3_QMP <- ds_MbrPrj_grd %>%
group_by(CD_PROGRAMA_IES, ID_PROJETO, NM_MEMBRO_PROJETO) %>%
summarise(QT = n()) %>%
group_by(CD_PROGRAMA_IES, ID_PROJETO) %>%
summarise(QMP = n())
write.csv2(ds_IMI3_QMP, paste0(v_path_inter, "ds_IMI3_QMP.csv"))
#### Geração de arquivo de colaboração no nível de projetos para conferência de dados -----------
ds_DFCP <- merge(ds_IMI3_DFPP, ds_IMI3_QMP , by = c("CD_PROGRAMA_IES", "ID_PROJETO")) %>%
mutate(DFCP = DFPP/QMP)# %>%
#mutate(DFCP = ifelse(DFCP <= 1, DFCP, 1)) ## Limpeza de ocorrências acima de 1.0
write.csv2(ds_DFCP, paste0(v_path_o, "DFCP.csv"))
#### --------------------------------------------------------------------------------------------
kable(ds_DFCP[1:12, ]) ## Amostra do arquivo gerado acima| CD_PROGRAMA_IES | ID_PROJETO | DFPP | QMP | DFCP |
|---|---|---|---|---|
| 10001018002P1 | 254229 | 3 | 5 | 0.6000000 |
| 10001018002P1 | 281461 | 1 | 2 | 0.5000000 |
| 10001018002P1 | 281506 | 6 | 11 | 0.5454545 |
| 10001018002P1 | 281550 | 1 | 1 | 1.0000000 |
| 10001018002P1 | 281556 | 2 | 3 | 0.6666667 |
| 10001018002P1 | 281569 | 1 | 1 | 1.0000000 |
| 10001018002P1 | 281575 | 1 | 1 | 1.0000000 |
| 10001018002P1 | 281577 | 1 | 2 | 0.5000000 |
| 10001018002P1 | 281593 | 1 | 1 | 1.0000000 |
| 10001018002P1 | 287006 | 3 | 2 | 1.5000000 |
| 10001018002P1 | 300058 | 2 | 2 | 1.0000000 |
| 10001018002P1 | 332254 | 2 | 4 | 0.5000000 |
ds_IMI3_DFCP <- merge(ds_IMI3_DFPP, ds_IMI3_QMP, by = c("CD_PROGRAMA_IES", "ID_PROJETO")) %>%
mutate(DFCP = DFPP/QMP) %>% ## Fórmula do indicador
#mutate(DFCP = ifelse(DFCP <= 1, DFCP, 1)) %>% ## Limpeza de ocorrências acima de 1.0
group_by(CD_PROGRAMA_IES) %>%
summarise(DFPP = mean(DFPP),
QMP = mean(QMP),
DFCP = mean(DFCP)) ## Consolidação de variáveis e indicador
write.csv2(ds_IMI3_DFCP, paste0(v_path_inter, "ds_IMI3_DFCP.csv"))Indicadores:
DIPP: Diversidade de instituições que que colaboram por meio dos projetos
ds_IMI3_CC <- merge(ds_IMI3_QIP, ds_IMI3_QPP, by = "CD_PROGRAMA_IES", all.x = T) %>%
merge(., ds_IMI3_DFCP, by = "CD_PROGRAMA_IES", all.x = T) %>% ## Junção com indicador de
## diversidade de formações
## de colaboradores
mutate(DIPP = QIP/QPP) %>% ## Fórmula do indicador
#mutate(DIPP = ifelse(DIPP <= 1, DIPP, 1)) %>% ## Limpeza de ocorrências acima de 1.0
mutate(CC = (DFCP + DIPP)/2) ## Fórmula do constructo
ds_IMI3_CC <- ds_IMI3_CC[,c(1:3, 7, 4:6, 8)] ## Reordenação de campos
ds_IMI3_CC %<>% merge(ds_prg, ., by = "CD_PROGRAMA_IES", all.y = T) ## Categorias
write.csv2(ds_IMI3_CC, paste0(v_path_o, "CC.csv"))
kable(ds_IMI3_CC[1:12, ]) #c(1,8:14)]) ## Amostra do arquivo gerado acima, sem as categorias| CD_PROGRAMA_IES | NM_AREA_AVALIACAO | SG_AREA_AVALIACAO | CS_STATUS_JURIDICO | DS_DEPENDENCIA_ADMINISTRATIVA | ANO_INICIO_PROGRAMA | NM_MODALIDADE_PROGRAMA | CD_CONCEITO_PROGRAMA | NM_REGIAO | SG_UF_PROGRAMA | SG_ENTIDADE_ENSINO | NM_PROGRAMA_IES | NM_GRAU_PROGRAMA | QIP | QPP | DIPP | DFPP | QMP | DFCP | CC |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10001018002P1 | CIÊNCIAS BIOLÓGICAS III | CBIII | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 3 | NORTE | RO | UNIR | BIOLOGIA EXPERIMENTAL | MESTRADO/DOUTORADO | 4 | 33 | 0.1212121 | 1.758621 | 2.586207 | 0.7962308 | 0.4587215 |
| 10001018004P4 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 1999 | ACADÊMICO | 4 | NORTE | RO | UNIR | DESENVOLVIMENTO REGIONAL E MEIO AMBIENTE | MESTRADO/DOUTORADO | 4 | 34 | 0.1176471 | 1.777778 | 1.555556 | 1.5000000 | 0.8088235 |
| 10001018005P0 | GEOGRAFIA | GEOG | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | GEOGRAFIA | MESTRADO/DOUTORADO | 1 | 8 | 0.1250000 | 1.071429 | 1.142857 | 0.9642857 | 0.5446429 |
| 10001018006P7 | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | ADM | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | ADMINISTRAÇÃO | MESTRADO | 2 | 3 | 0.6666667 | 1.777778 | 1.333333 | 1.3333333 | 1.0000000 |
| 10001018008P0 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 2 | 9 | 0.2222222 | NA | NA | NA | NA |
| 10001018009P6 | PSICOLOGIA | PSICO | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | RO | UNIR | PSICOLOGIA | MESTRADO | 4 | 21 | 0.1904762 | 1.538461 | 1.769231 | 0.9166667 | 0.5535714 |
| 10001018010P4 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | LETRAS | MESTRADO | 1 | 5 | 0.2000000 | 2.333333 | 1.666667 | 1.4722222 | 0.8361111 |
| 10001018011P0 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | EDUCAÇÃO | MESTRADO | 5 | 18 | 0.2777778 | 2.500000 | 1.166667 | 2.1666667 | 1.2222222 |
| 10001018012P7 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2011 | ACADÊMICO | 3 | NORTE | RO | UNIR | ESTUDOS LITERÁRIOS | MESTRADO | 2 | 7 | 0.2857143 | 2.000000 | 1.500000 | 1.5000000 | 0.8928571 |
| 10001018013P3 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 2012 | PROFISSIONAL | 3 | NORTE | RO | UNIR | ENSINO EM CIÊNCIAS DA SAÚDE | MESTRADO PROFISSIONAL | 1 | 1 | 1.0000000 | NA | NA | NA | NA |
| 10001018016P2 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2014 | PROFISSIONAL | 3 | NORTE | RO | UNIR | EDUCAÇÃO ESCOLAR | MESTRADO PROFISSIONAL | 6 | 24 | 0.2500000 | 1.500000 | 1.277778 | 1.2592593 | 0.7546296 |
| 10001018017P9 | CIÊNCIAS AMBIENTAIS | CAMB | FEDERAL | PÚBLICA | 2013 | ACADÊMICO | 3 | NORTE | RO | UNIR | CIÊNCIAS AMBIENTAIS | MESTRADO | 7 | 52 | 0.1346154 | 1.485714 | 1.514286 | 0.9857143 | 0.5601648 |
Variáveis:
QCDI: Quantidade de combinações distintas informadas
QGAD: Quantidade de grande áreas de conhecimento que o docente atua
QACD: Quantidade de áreas do conhecimento que o docente atua
Indicadores:
DGAC: Diversidade de grande áreas do conhecimento que o docente atua
DAC: Diversidade de áreas do conhecimento que o docente atua
ds_aratdo <- read_excel(paste0(v_path_i, 'Areas_de_atuacao_docentes_25_06_2019.xlsx'))
ds_IMI4_QCDI <- ds_aratdo %>%
mutate(espec_doc = paste0(grande_area, nome_area, sub_area, especialidade)) %>%
group_by(cod_programa, nome_filtro_cvlattes, espec_doc) %>%
summarise(QT = n()) %>%
group_by(cod_programa, nome_filtro_cvlattes) %>%
summarise(QCDI = n())
write.csv2(ds_IMI4_QCDI, paste0(v_path_inter, "ds_IMI4_QCDI.csv"))
ds_IMI4_QGAD <- ds_aratdo %>%
group_by(cod_programa, nome_filtro_cvlattes, grande_area) %>%
summarise(QT = n()) %>%
group_by(cod_programa, nome_filtro_cvlattes) %>%
summarise(QGAD = n())
write.csv2(ds_IMI4_QGAD, paste0(v_path_inter, "ds_IMI4_QGAD.csv"))
ds_IMI4_QACD <- ds_aratdo %>%
group_by(cod_programa, nome_filtro_cvlattes, nome_area) %>%
summarise(QT = n()) %>%
group_by(cod_programa, nome_filtro_cvlattes) %>%
summarise(QACD = n())
write.csv2(ds_IMI4_QACD, paste0(v_path_inter, "ds_IMI4_QACD.csv"))
ds_IMI4_CP <- merge(ds_IMI4_QGAD, ds_IMI4_QACD, by = c("cod_programa","nome_filtro_cvlattes"), all.x = T) %>%
merge(., ds_IMI4_QCDI, by = c("cod_programa","nome_filtro_cvlattes"), all.x = T) %>%
mutate(DGAC = QGAD/QCDI,
DAC = QACD/QCDI) %>% ## Fórmulas dos indicadores
#mutate(DGAC = ifelse(DGAC <= 1, DGAC, 1),
# DAC = ifelse(DAC <= 1, DAC, 1)) %>% ## Limpeza de ocorrências acima de 1.0
mutate(CP = (DGAC + DAC)/2) ## Fórmula do constructo
write.csv2(ds_IMI4_CP, paste0(v_path_o, "CP_docente.csv"))
kable(ds_IMI4_CP[1:12, ]) ## Amostra do arquivo gerado acima| cod_programa | nome_filtro_cvlattes | QGAD | QACD | QCDI | DGAC | DAC | CP |
|---|---|---|---|---|---|---|---|
| 10001018002P1 | ALEXANDRE DE ALMEIDA E SILVA | 1 | 3 | 3 | 0.3333333 | 1.0000000 | 0.6666667 |
| 10001018002P1 | ANDREIMAR MARTINS SOARES | 1 | 2 | 3 | 0.3333333 | 0.6666667 | 0.5000000 |
| 10001018002P1 | CARLA FREIRE CELEDONIO FERNANDES | 2 | 3 | 3 | 0.6666667 | 1.0000000 | 0.8333333 |
| 10001018002P1 | CAROLINA BIONI GARCIA TELES | 1 | 2 | 2 | 0.5000000 | 1.0000000 | 0.7500000 |
| 10001018002P1 | CHRISTIAN COLLINS KUEHN | 2 | 3 | 3 | 0.6666667 | 1.0000000 | 0.8333333 |
| 10001018002P1 | DEUSILENE SOUZA VIEIRA DALLACQUA | 2 | 3 | 6 | 0.3333333 | 0.5000000 | 0.4166667 |
| 10001018002P1 | DHELIO BATISTA PEREIRA | 2 | 3 | 3 | 0.6666667 | 1.0000000 | 0.8333333 |
| 10001018002P1 | FERNANDO BERTON ZANCHI | 2 | 6 | 6 | 0.3333333 | 1.0000000 | 0.6666667 |
| 10001018002P1 | GABRIEL EDUARDO MELIM FERREIRA | 1 | 1 | 2 | 0.5000000 | 0.5000000 | 0.5000000 |
| 10001018002P1 | GENIMAR REBOUCAS JULIAO | 1 | 1 | 4 | 0.2500000 | 0.2500000 | 0.2500000 |
| 10001018002P1 | JANSEN FERNANDES DE MEDEIROS | 2 | 3 | 4 | 0.5000000 | 0.7500000 | 0.6250000 |
| 10001018002P1 | JUAN MIGUEL VILLALOBOS-SALCEDO | 1 | 1 | 1 | 1.0000000 | 1.0000000 | 1.0000000 |
ds_IMI4_CP_pgr <- ds_IMI4_CP %>%
group_by(cod_programa) %>%
summarise(CP = mean(CP)) %>% ## Consolidação por programa
merge(ds_prg, ., by.x = "CD_PROGRAMA_IES", by.y = "cod_programa", all.y = T) ## Categorias
write.csv2(ds_IMI4_CP_pgr, paste0(v_path_o, "CP_programa.csv"))
kable(ds_IMI4_CP_pgr[1:12, ]) #c(1,8)]) ## Amostra do arquivo gerado acima, sem as categorias| CD_PROGRAMA_IES | NM_AREA_AVALIACAO | SG_AREA_AVALIACAO | CS_STATUS_JURIDICO | DS_DEPENDENCIA_ADMINISTRATIVA | ANO_INICIO_PROGRAMA | NM_MODALIDADE_PROGRAMA | CD_CONCEITO_PROGRAMA | NM_REGIAO | SG_UF_PROGRAMA | SG_ENTIDADE_ENSINO | NM_PROGRAMA_IES | NM_GRAU_PROGRAMA | CP |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10001018002P1 | CIÊNCIAS BIOLÓGICAS III | CBIII | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 3 | NORTE | RO | UNIR | BIOLOGIA EXPERIMENTAL | MESTRADO/DOUTORADO | 0.6157407 |
| 10001018004P4 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 1999 | ACADÊMICO | 4 | NORTE | RO | UNIR | DESENVOLVIMENTO REGIONAL E MEIO AMBIENTE | MESTRADO/DOUTORADO | 0.5246528 |
| 10001018005P0 | GEOGRAFIA | GEOG | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | GEOGRAFIA | MESTRADO/DOUTORADO | 0.5009804 |
| 10001018006P7 | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | ADM | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | ADMINISTRAÇÃO | MESTRADO | 0.4352564 |
| 10001018009P6 | PSICOLOGIA | PSICO | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | RO | UNIR | PSICOLOGIA | MESTRADO | 0.4255556 |
| 10001018010P4 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | LETRAS | MESTRADO | 0.4404762 |
| 10001018011P0 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | EDUCAÇÃO | MESTRADO | 0.3204545 |
| 10001018012P7 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2011 | ACADÊMICO | 3 | NORTE | RO | UNIR | ESTUDOS LITERÁRIOS | MESTRADO | 0.4531250 |
| 10001018016P2 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2014 | PROFISSIONAL | 3 | NORTE | RO | UNIR | EDUCAÇÃO ESCOLAR | MESTRADO PROFISSIONAL | 0.4513158 |
| 10001018017P9 | CIÊNCIAS AMBIENTAIS | CAMB | FEDERAL | PÚBLICA | 2013 | ACADÊMICO | 3 | NORTE | RO | UNIR | CIÊNCIAS AMBIENTAIS | MESTRADO | 0.4368590 |
| 10001018039P2 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 0.3890625 |
| 10001018040P0 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 0.4888889 |
Junção de todos os constructos, limpeza de casos imcompletos e geração de output.
ds_IMI <- merge(ds_IMI1_FCDo[,c("CD_PROGRAMA_IES", "FCDo")],
ds_IMI2_FCDi[,c("CD_PROGRAMA_IES", "FCDi" )],
by = "CD_PROGRAMA_IES", all = T) %>%
merge(., ds_IMI3_CC[,c("CD_PROGRAMA_IES","CC")],
by = "CD_PROGRAMA_IES", all = T) %>%
merge(., ds_IMI4_CP_pgr[,c("CD_PROGRAMA_IES","CP")],
by = "CD_PROGRAMA_IES", all = T)
ds_IMI <- ds_IMI[complete.cases(ds_IMI),] ## Casos completos
ds_IMI %<>% mutate(IMI = (FCDo + FCDi + CC + CP)/4) %>%
merge(ds_prg, ., by = "CD_PROGRAMA_IES", all.y = T) ## Categorias
write.csv2(ds_IMI, paste0(v_path_o, "IMI.csv"))
kable(ds_IMI[1:12, ]) #c(1,8:12)]) ## Amostra do arquivo gerado acima, sem as categorias| CD_PROGRAMA_IES | NM_AREA_AVALIACAO | SG_AREA_AVALIACAO | CS_STATUS_JURIDICO | DS_DEPENDENCIA_ADMINISTRATIVA | ANO_INICIO_PROGRAMA | NM_MODALIDADE_PROGRAMA | CD_CONCEITO_PROGRAMA | NM_REGIAO | SG_UF_PROGRAMA | SG_ENTIDADE_ENSINO | NM_PROGRAMA_IES | NM_GRAU_PROGRAMA | FCDo | FCDi | CC | CP | IMI |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10001018002P1 | CIÊNCIAS BIOLÓGICAS III | CBIII | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 3 | NORTE | RO | UNIR | BIOLOGIA EXPERIMENTAL | MESTRADO/DOUTORADO | 0.5333333 | 0.2758621 | 0.4587215 | 0.6157407 | 0.4709144 |
| 10001018004P4 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 1999 | ACADÊMICO | 4 | NORTE | RO | UNIR | DESENVOLVIMENTO REGIONAL E MEIO AMBIENTE | MESTRADO/DOUTORADO | 0.8222222 | 0.6097561 | 0.8088235 | 0.5246528 | 0.6913637 |
| 10001018005P0 | GEOGRAFIA | GEOG | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | GEOGRAFIA | MESTRADO/DOUTORADO | 0.3333333 | 0.5476190 | 0.5446429 | 0.5009804 | 0.4816439 |
| 10001018006P7 | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | ADM | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | ADMINISTRAÇÃO | MESTRADO | 0.6666667 | 0.4583333 | 1.0000000 | 0.4352564 | 0.6400641 |
| 10001018009P6 | PSICOLOGIA | PSICO | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | RO | UNIR | PSICOLOGIA | MESTRADO | 0.4333333 | 0.4038462 | 0.5535714 | 0.4255556 | 0.4540766 |
| 10001018010P4 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | LETRAS | MESTRADO | 0.4666667 | 0.4246575 | 0.8361111 | 0.4404762 | 0.5419779 |
| 10001018011P0 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | EDUCAÇÃO | MESTRADO | 0.6363636 | 0.3968254 | 1.2222222 | 0.3204545 | 0.6439665 |
| 10001018012P7 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2011 | ACADÊMICO | 3 | NORTE | RO | UNIR | ESTUDOS LITERÁRIOS | MESTRADO | 0.5952381 | 0.6739130 | 0.8928571 | 0.4531250 | 0.6537833 |
| 10001018016P2 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2014 | PROFISSIONAL | 3 | NORTE | RO | UNIR | EDUCAÇÃO ESCOLAR | MESTRADO PROFISSIONAL | 0.4901961 | 0.4814815 | 0.7546296 | 0.4513158 | 0.5444057 |
| 10001018017P9 | CIÊNCIAS AMBIENTAIS | CAMB | FEDERAL | PÚBLICA | 2013 | ACADÊMICO | 3 | NORTE | RO | UNIR | CIÊNCIAS AMBIENTAIS | MESTRADO | 0.7111111 | 0.6727273 | 0.5601648 | 0.4368590 | 0.5952155 |
| 11001011004P7 | CIÊNCIAS AGRÁRIAS I | CAGRI | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 3 | NORTE | AC | UFAC | PRODUÇÃO VEGETAL | MESTRADO/DOUTORADO | 0.4117647 | 0.2058824 | 0.3863636 | 0.4513889 | 0.3638499 |
| 11001011006P0 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 2011 | ACADÊMICO | 3 | NORTE | AC | UFAC | CIÊNCIA, INOVAÇÃO E TECNOLOGIA PARA A AMAZÔNIA | MESTRADO | 0.7333333 | 0.8500000 | 0.5902778 | 0.4309524 | 0.6511409 |
Preparação, transformações e calculo de variáveis e indicadores que compõe o IPT - Indice de Produção Tecnologica.
Variáveis:
SPPP: Soma de patentes produzidos por programa
SPPPr: Soma de produtos produzidos por programa
SAPP: Soma de aplicativos produzidos por programa
QPPP: Quantidade de professores permanentes do programa
Indicadores:
QPPa: Quantitativo de produção de patentes por Programa
QPPr: Quantitativo de produção de produtos por Programa
QPA: Quantitativo de produção de aplicativos por Programa
#### Carga de Aplicativos, patentes e PRodutos a partir de planilhas ----------------------------
ds_PT_appprg <- read_excel(paste0(v_path_i, "Aplicativos_tese.xlsx"))
ds_PT_patprg <- read_excel(paste0(v_path_i, "Patentes com Programas.xlsx"))
ds_PT_prdprg <- read_excel(paste0(v_path_i, "Produtos_tese.xlsx"))
#### --------------------------------------------------------------------------------------------
ds_PT_patprg <- ds_PT_patprg[complete.cases(ds_PT_patprg[,"NM_PRODUCAO"]),] ## Filtro de produção valida
ds_IPT1_SPPP<- ds_PT_patprg %>%
group_by(CD_PROGRAMA_IES) %>%
summarise(SPPP = n())
write.csv2(ds_IPT1_SPPP, paste0(v_path_inter, "ds_IPT1_SPPP.csv"))
#### --------------------------------------------------------------------------------------------
ds_PT_prdprg <- ds_PT_prdprg[complete.cases(ds_PT_prdprg[,"DSFINALIDADE_TRATADA"]),] ## Filtro de produção valida
ds_IPT2_SPPPr <- ds_PT_prdprg %>%
group_by(CD_PROGRAMA_IES) %>%
summarise(SPPPr = n())
write.csv2(ds_IPT2_SPPPr, paste0(v_path_inter, "ds_IPT2_SPPPr.csv"))
#### --------------------------------------------------------------------------------------------
ds_PT_appprg <- ds_PT_appprg[complete.cases(ds_PT_appprg[,"DS_FINALIDADE"]),] ## Filtro de produção valida
ds_IPT3_SAPP <- ds_PT_appprg %>%
group_by(CD_PROGRAMA_IES) %>%
summarise(SAPP = n())
write.csv2(ds_IPT3_SAPP, paste0(v_path_inter, "ds_IPT3_SAPP.csv"))
#### --------------------------------------------------------------------------------------------
ds_IPT <- merge(ds_IMI1_QPPP, ds_IPT1_SPPP, by.x = "cod_programa", by.y = "CD_PROGRAMA_IES", all.x = T) %>%
select(CD_PROGRAMA_IES = cod_programa, QPPP, SPPP) %>%
merge(., ds_IPT2_SPPPr, by = "CD_PROGRAMA_IES", all.x = T) %>%
merge(., ds_IPT3_SAPP, by = "CD_PROGRAMA_IES", all.x = T)
ds_IPT[is.na(ds_IPT)] <- 0 ### Conversão de NA para 0
# ds_IPT %<>% mutate(QPPa = SPPP/QPPP,
# QPPr = SPPPr/QPPP,
# QPA = SAPP/QPPP) %>% ## Fórmulas dos indicadores
# #mutate(QPPa = ifelse(QPPa <= 1, QPPa, 1),
# # QPPr = ifelse(QPPr <= 1, QPPr, 1),
# # QPA = ifelse(QPA <= 1, QPA, 1)) %>% ## Limpeza de ocorrências acima de 1.0
# mutate(IPT = (QPPa+QPPr+QPA)/3) %>% ## Fórmula do indice
# merge(ds_prg, ., by = "CD_PROGRAMA_IES", all.y = T) ## Categorias
ds_IPT %<>% mutate(QPPa = SPPP,
QPPr = SPPPr,
QPA = SAPP) %>% ## Fórmulas dos indicadores
#mutate(QPPa = ifelse(QPPa <= 1, QPPa, 1),
# QPPr = ifelse(QPPr <= 1, QPPr, 1),
# QPA = ifelse(QPA <= 1, QPA, 1)) %>% ## Limpeza de ocorrências acima de 1.0
mutate(IPT = (QPPa+QPPr+QPA)/QPPP) %>% ## Fórmula do indice
merge(ds_prg, ., by = "CD_PROGRAMA_IES", all.y = T) ## Categorias
write.csv2(ds_IPT, paste0(v_path_o, "IPT.csv"))
kable(ds_IPT[1:12, ]) #c(1,8:15)]) ## Amostra do arquivo gerado acima, sem as categorias| CD_PROGRAMA_IES | NM_AREA_AVALIACAO | SG_AREA_AVALIACAO | CS_STATUS_JURIDICO | DS_DEPENDENCIA_ADMINISTRATIVA | ANO_INICIO_PROGRAMA | NM_MODALIDADE_PROGRAMA | CD_CONCEITO_PROGRAMA | NM_REGIAO | SG_UF_PROGRAMA | SG_ENTIDADE_ENSINO | NM_PROGRAMA_IES | NM_GRAU_PROGRAMA | QPPP | SPPP | SPPPr | SAPP | QPPa | QPPr | QPA | IPT |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10001018002P1 | CIÊNCIAS BIOLÓGICAS III | CBIII | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 3 | NORTE | RO | UNIR | BIOLOGIA EXPERIMENTAL | MESTRADO/DOUTORADO | 15 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
| 10001018004P4 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 1999 | ACADÊMICO | 4 | NORTE | RO | UNIR | DESENVOLVIMENTO REGIONAL E MEIO AMBIENTE | MESTRADO/DOUTORADO | 15 | 1 | 1 | 0 | 1 | 1 | 0 | 0.1333333 |
| 10001018005P0 | GEOGRAFIA | GEOG | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | GEOGRAFIA | MESTRADO/DOUTORADO | 15 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
| 10001018006P7 | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | ADM | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | ADMINISTRAÇÃO | MESTRADO | 9 | 0 | 3 | 0 | 0 | 3 | 0 | 0.3333333 |
| 10001018009P6 | PSICOLOGIA | PSICO | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | RO | UNIR | PSICOLOGIA | MESTRADO | 10 | 0 | 2 | 0 | 0 | 2 | 0 | 0.2000000 |
| 10001018010P4 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | LETRAS | MESTRADO | 15 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
| 10001018011P0 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2010 | ACADÊMICO | 3 | NORTE | RO | UNIR | EDUCAÇÃO | MESTRADO | 11 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
| 10001018012P7 | LETRAS / LINGUÍSTICA | LETR | FEDERAL | PÚBLICA | 2011 | ACADÊMICO | 3 | NORTE | RO | UNIR | ESTUDOS LITERÁRIOS | MESTRADO | 14 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
| 10001018016P2 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 2014 | PROFISSIONAL | 3 | NORTE | RO | UNIR | EDUCAÇÃO ESCOLAR | MESTRADO PROFISSIONAL | 17 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
| 10001018017P9 | CIÊNCIAS AMBIENTAIS | CAMB | FEDERAL | PÚBLICA | 2013 | ACADÊMICO | 3 | NORTE | RO | UNIR | CIÊNCIAS AMBIENTAIS | MESTRADO | 15 | 4 | 3 | 1 | 4 | 3 | 1 | 0.5333333 |
| 10001018039P2 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 14 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
| 10001018040P0 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | 12 | 0 | 0 | 0 | 0 | 0 | 0 | 0.0000000 |
União de indices por programa, filtro de cassos completos, categorização e calculo de correlação geral.
ds_COR <- merge(ds_IMI[,c(1,18)], ds_IPT[,c(1,21)], by = "CD_PROGRAMA_IES", all = T) ## União de indices
ds_COR <- ds_COR[complete.cases(ds_COR),] ## Filtro de casos completos
ds_COR %<>% filter(IPT > 0)%>% ## Filtro de projetos com produção tecnologica
merge(ds_prg, ., by = "CD_PROGRAMA_IES", all.y = T) ## Categorias
write.csv2(ds_COR, paste0(v_path_o, "COR.csv"))
kable(ds_COR[1:12, ]) #c(1,8:9)]) ## Amostra do arquivo gerado acima, sem as categorias| CD_PROGRAMA_IES | NM_AREA_AVALIACAO | SG_AREA_AVALIACAO | CS_STATUS_JURIDICO | DS_DEPENDENCIA_ADMINISTRATIVA | ANO_INICIO_PROGRAMA | NM_MODALIDADE_PROGRAMA | CD_CONCEITO_PROGRAMA | NM_REGIAO | SG_UF_PROGRAMA | SG_ENTIDADE_ENSINO | NM_PROGRAMA_IES | NM_GRAU_PROGRAMA | IMI | IPT |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10001018004P4 | INTERDISCIPLINAR | INTE | FEDERAL | PÚBLICA | 1999 | ACADÊMICO | 4 | NORTE | RO | UNIR | DESENVOLVIMENTO REGIONAL E MEIO AMBIENTE | MESTRADO/DOUTORADO | 0.6913637 | 0.1333333 |
| 10001018006P7 | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | ADM | FEDERAL | PÚBLICA | 2006 | ACADÊMICO | 4 | NORTE | RO | UNIR | ADMINISTRAÇÃO | MESTRADO | 0.6400641 | 0.3333333 |
| 10001018009P6 | PSICOLOGIA | PSICO | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | RO | UNIR | PSICOLOGIA | MESTRADO | 0.4540766 | 0.2000000 |
| 10001018017P9 | CIÊNCIAS AMBIENTAIS | CAMB | FEDERAL | PÚBLICA | 2013 | ACADÊMICO | 3 | NORTE | RO | UNIR | CIÊNCIAS AMBIENTAIS | MESTRADO | 0.5952155 | 0.5333333 |
| 12001015001P0 | EDUCAÇÃO | EDUC | FEDERAL | PÚBLICA | 1987 | ACADÊMICO | 4 | NORTE | AM | UFAM | EDUCAÇÃO | MESTRADO/DOUTORADO | 0.4167405 | 0.0588235 |
| 12001015002P7 | QUÍMICA | QUIM | FEDERAL | PÚBLICA | 1987 | ACADÊMICO | 4 | NORTE | AM | UFAM | QUÍMICA | MESTRADO/DOUTORADO | 0.3374479 | 0.3928571 |
| 12001015003P3 | CIÊNCIAS AGRÁRIAS I | CAGRI | FEDERAL | PÚBLICA | 1995 | ACADÊMICO | 4 | NORTE | AM | UFAM | AGRONOMIA TROPICAL | MESTRADO/DOUTORADO | 0.4392376 | 0.0666667 |
| 12001015012P2 | CIÊNCIA DA COMPUTAÇÃO | CCOMP | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 5 | NORTE | AM | UFAM | INFORMÁTICA | MESTRADO/DOUTORADO | 0.3936089 | 0.8461538 |
| 12001015013P9 | BIOTECNOLOGIA | BIOT | FEDERAL | PÚBLICA | 2001 | ACADÊMICO | 4 | NORTE | AM | UFAM | BIOTECNOLOGIA | MESTRADO/DOUTORADO | 0.4673809 | 0.5185185 |
| 12001015016P8 | CIÊNCIAS AGRÁRIAS I | CAGRI | FEDERAL | PÚBLICA | 2003 | ACADÊMICO | 3 | NORTE | AM | UFAM | CIÊNCIAS FLORESTAIS E AMBIENTAIS | MESTRADO | 0.5455184 | 1.1875000 |
| 12001015021P1 | ENGENHARIAS IV | ENGIV | FEDERAL | PÚBLICA | 2005 | ACADÊMICO | 3 | NORTE | AM | UFAM | ENGENHARIA ELÉTRICA | MESTRADO | 0.4103666 | 1.0000000 |
| 12001015033P0 | FARMÁCIA | FARM | FEDERAL | PÚBLICA | 2009 | ACADÊMICO | 3 | NORTE | AM | UFAM | CIÊNCIAS FARMACÊUTICAS | MESTRADO | 0.5808275 | 0.5000000 |
ds_COR_p <- ds_COR %>%
select(IMI, IPT) %>%
cor(., method = "pearson") ## Correlação geral
write.csv2(ds_COR_p, paste0(v_path_o, "COR_p.csv"))
as_tibble(ds_COR_p) ## Tabela de correlação Geral## # A tibble: 2 x 2
## IMI IPT
## <dbl> <dbl>
## 1 1 0.0826
## 2 0.0826 1
Segmentação de tabela base de indice por cada categoria: Ano, Conceito, Dependencia, Area, Status e Modalidade. Geração de todos os outputs.
##### ---------------------------------------------------------------------------------------
f.corr <- function(df, mtd = "pearson"){
df %<>% select(IMI,IPT) %>%
cor(., method = mtd)
return(df)
} ## Função para aplicação de correlação em cada sessão do split por categoria
f.print_corr <- function(df){
dfo <- tibble(cat = as.character(), cor = as.double())
for (i in seq_along(df)) {
dfo[i,] <- c(names(df[i]), df[[i]][1,2])
}
return(dfo)
} ## Função para criação de dataset com correlação por item de categoria
##### ---------------------------------------------------------------------------------------
ano_f <- factor(ds_COR$ANO_INICIO_PROGRAMA) ## Fator para split de categoria
ds_COR_ano <- ds_COR %>% select(ANO_INICIO_PROGRAMA,IMI,IPT) %>%
split(ano_f, drop = T) %>% ## Separação por ano
map(f.corr) ## Calculo de correlação para cada segmento
ds_COR_ano <- f.print_corr(ds_COR_ano)
ds_COR_ano <- ds_COR %>% group_by(ANO_INICIO_PROGRAMA) %>%
summarise(m_IMI = mean(IMI), #|
m_IPT = mean(IPT), #| Média
md_IMI = median(IMI), #|
md_IPT = median(IPT), #| Mediana
v_IMI = var(IMI), #|
v_IPT = var(IPT), #| Variancia
d_IMI = sd(IMI), #|
d_IPT = sd(IPT), #| Devio padrão
pc_IMI = (d_IMI/m_IMI)*100, #|
pc_IPT = (d_IPT/m_IPT)*100) %>% #| Percentual do desvio padrão sobre valor esperado
merge(., ds_COR_ano, by.x = "ANO_INICIO_PROGRAMA", by.y = "cat", all = T) %>%
mutate(ANO_INICIO_PROGRAMA = as.character(ANO_INICIO_PROGRAMA))
write.csv2(ds_COR_ano, paste0(v_path_o, "COR_ano.csv"))
kable(ds_COR_ano)| ANO_INICIO_PROGRAMA | m_IMI | m_IPT | md_IMI | md_IPT | v_IMI | v_IPT | d_IMI | d_IPT | pc_IMI | pc_IPT | cor |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 1931 | 0.3199041 | 0.0149254 | 0.3199041 | 0.0149254 | NA | NA | NaN | NaN | NaN | NaN | NA |
| 1960 | 0.2906369 | 0.0800000 | 0.2906369 | 0.0800000 | NA | NA | NaN | NaN | NaN | NaN | NA |
| 1961 | 0.3326053 | 0.1153846 | 0.3326053 | 0.1153846 | NA | NA | NaN | NaN | NaN | NaN | NA |
| 1962 | 0.2909908 | 0.8636364 | 0.2909908 | 0.8636364 | NA | NA | NaN | NaN | NaN | NaN | NA |
| 1963 | 0.4224360 | 0.7799943 | 0.4420337 | 0.8333333 | 0.0055759 | 0.4919185 | 0.0746722 | 0.7013690 | 17.676584 | 89.91975 | -0.279360741597756 |
| 1964 | 0.4172452 | 0.1758057 | 0.4158835 | 0.0909091 | 0.0001782 | 0.0318763 | 0.0133479 | 0.1785395 | 3.199062 | 101.55501 | 0.0107109954054532 |
| 1965 | 0.3684658 | 0.2294030 | 0.3642293 | 0.1851852 | 0.0017509 | 0.0487351 | 0.0418441 | 0.2207602 | 11.356319 | 96.23250 | 0.518191879073868 |
| 1966 | 0.3555605 | 0.0724401 | 0.3478187 | 0.0784314 | 0.0009376 | 0.0002198 | 0.0306201 | 0.0148264 | 8.611793 | 20.46715 | 0.837407776423125 |
| 1967 | 0.4627200 | 0.6547525 | 0.4705810 | 0.3809524 | 0.0168524 | 0.2543583 | 0.1298169 | 0.5043395 | 28.055176 | 77.02749 | -0.137471030418654 |
| 1968 | 0.3722266 | 0.3288689 | 0.3817618 | 0.3248792 | 0.0034017 | 0.0499029 | 0.0583238 | 0.2233895 | 15.668891 | 67.92663 | 0.555405114279481 |
| 1969 | 0.3938819 | 0.5328236 | 0.3827501 | 0.1363636 | 0.0044739 | 0.3053323 | 0.0668873 | 0.5525688 | 16.981560 | 103.70576 | -0.255282855732563 |
| 1970 | 0.4006669 | 0.4226643 | 0.3889770 | 0.2083333 | 0.0047211 | 0.4860000 | 0.0687103 | 0.6971370 | 17.148987 | 164.93871 | 0.0253886938277682 |
| 1971 | 0.4242879 | 0.3248551 | 0.4260215 | 0.1944444 | 0.0086889 | 0.0861534 | 0.0932143 | 0.2935190 | 21.969585 | 90.35381 | 0.362673620111089 |
| 1972 | 0.4089485 | 0.2891491 | 0.3988590 | 0.1333333 | 0.0054947 | 0.1273023 | 0.0741260 | 0.3567944 | 18.126002 | 123.39464 | -0.113775889614342 |
| 1973 | 0.4075005 | 0.2437085 | 0.3879282 | 0.1428571 | 0.0077680 | 0.0694440 | 0.0881364 | 0.2635223 | 21.628538 | 108.13011 | 0.163585764158018 |
| 1974 | 0.4094598 | 0.4775103 | 0.4136139 | 0.1875000 | 0.0089763 | 0.2647945 | 0.0947434 | 0.5145819 | 23.138627 | 107.76352 | -0.101549928788803 |
| 1975 | 0.3928092 | 0.2468051 | 0.4216270 | 0.1184211 | 0.0054931 | 0.0482017 | 0.0741154 | 0.2195489 | 18.868049 | 88.95637 | 0.168399766462523 |
| 1976 | 0.4126252 | 0.3784836 | 0.4075583 | 0.2222222 | 0.0045110 | 0.1728359 | 0.0671640 | 0.4157354 | 16.277234 | 109.84238 | -0.076302244542845 |
| 1977 | 0.4197404 | 0.3285929 | 0.3944808 | 0.3000000 | 0.0055624 | 0.0753637 | 0.0745813 | 0.2745244 | 17.768424 | 83.54545 | -0.148706760233711 |
| 1978 | 0.4188940 | 0.2432078 | 0.3888669 | 0.2020202 | 0.0059178 | 0.0377641 | 0.0769273 | 0.1943298 | 18.364393 | 79.90280 | 0.316615355359667 |
| 1979 | 0.4033935 | 0.3243147 | 0.3972751 | 0.1764706 | 0.0073748 | 0.1666488 | 0.0858766 | 0.4082264 | 21.288544 | 125.87354 | 0.0603263128165099 |
| 1980 | 0.4095709 | 0.4005105 | 0.3884188 | 0.3396226 | 0.0047357 | 0.0921249 | 0.0688165 | 0.3035209 | 16.802108 | 75.78350 | -0.0582955284399762 |
| 1981 | 0.5972870 | 0.3333333 | 0.5972870 | 0.3333333 | NA | NA | NaN | NaN | NaN | NaN | NA |
| 1982 | 0.3644272 | 0.4168182 | 0.3716151 | 0.2336364 | 0.0017530 | 0.2343974 | 0.0418694 | 0.4841461 | 11.489094 | 116.15281 | -0.74715657251592 |
| 1983 | 0.3933543 | 0.4451562 | 0.3848218 | 0.4392857 | 0.0033831 | 0.1034962 | 0.0581643 | 0.3217082 | 14.786740 | 72.26862 | 0.130712028859849 |
| 1984 | 0.3888532 | 0.0937951 | 0.3841647 | 0.0909091 | 0.0003384 | 0.0022738 | 0.0183955 | 0.0476846 | 4.730707 | 50.83911 | -0.346162251180185 |
| 1985 | 0.4209200 | 0.8847640 | 0.4108929 | 0.5972222 | 0.0119887 | 1.7273645 | 0.1094931 | 1.3142924 | 26.012817 | 148.54723 | 0.393803446485817 |
| 1986 | 0.4304637 | 0.3628671 | 0.4308377 | 0.1702128 | 0.0024812 | 0.2650474 | 0.0498120 | 0.5148276 | 11.571707 | 141.87772 | -0.0405634611728774 |
| 1987 | 0.4287715 | 0.2726826 | 0.4218134 | 0.2818182 | 0.0113534 | 0.0305173 | 0.1065523 | 0.1746921 | 24.850614 | 64.06426 | -0.582004185468273 |
| 1988 | 0.4168515 | 0.3043651 | 0.4025463 | 0.2250000 | 0.0060657 | 0.0900747 | 0.0778823 | 0.3001245 | 18.683464 | 98.60676 | -0.0482735242579467 |
| 1989 | 0.4427132 | 0.2721098 | 0.4351138 | 0.1213235 | 0.0088743 | 0.1555475 | 0.0942037 | 0.3943951 | 21.278722 | 144.93967 | -0.0504497634354278 |
| 1990 | 0.4234577 | 0.5512301 | 0.4163677 | 0.4166667 | 0.0054714 | 0.3934467 | 0.0739692 | 0.6272533 | 17.467912 | 113.79154 | -0.203372041468122 |
| 1991 | 0.4347374 | 0.3267174 | 0.4514792 | 0.1263298 | 0.0103084 | 0.2055061 | 0.1015305 | 0.4533278 | 23.354446 | 138.75227 | -0.0862484816657559 |
| 1992 | 0.3826036 | 0.3671364 | 0.3782511 | 0.2631579 | 0.0037986 | 0.1161113 | 0.0616330 | 0.3407511 | 16.108840 | 92.81323 | 0.531810710379119 |
| 1993 | 0.4447181 | 0.5202737 | 0.4391082 | 0.2272727 | 0.0102292 | 0.2904866 | 0.1011394 | 0.5389681 | 22.742359 | 103.59318 | 0.653334352806853 |
| 1994 | 0.4804656 | 0.4926820 | 0.4690880 | 0.2352941 | 0.0071303 | 0.4470479 | 0.0844409 | 0.6686164 | 17.574816 | 135.70953 | 0.168660160183952 |
| 1995 | 0.4653334 | 0.2605693 | 0.4392376 | 0.1333333 | 0.0088861 | 0.1001033 | 0.0942662 | 0.3163910 | 20.257783 | 121.42299 | 0.0982965289483125 |
| 1996 | 0.4647403 | 0.4143830 | 0.4173302 | 0.3818182 | 0.0113045 | 0.0758238 | 0.1063227 | 0.2753612 | 22.877880 | 66.45089 | 0.0551069508890045 |
| 1997 | 0.4889277 | 0.5282726 | 0.5038892 | 0.1250000 | 0.0178683 | 1.6238229 | 0.1336723 | 1.2742931 | 27.339882 | 241.21884 | 0.176731763322921 |
| 1998 | 0.4807234 | 0.3714559 | 0.4744305 | 0.3076923 | 0.0161287 | 0.1009713 | 0.1269990 | 0.3177598 | 26.418312 | 85.54444 | 0.0662071149890463 |
| 1999 | 0.4707600 | 0.3739527 | 0.4600201 | 0.2368421 | 0.0120415 | 0.1449999 | 0.1097339 | 0.3807885 | 23.309938 | 101.82798 | 0.0904874578091118 |
| 2000 | 0.4816768 | 0.6186901 | 0.4504599 | 0.2933094 | 0.0137989 | 0.5944991 | 0.1174687 | 0.7710377 | 24.387455 | 124.62421 | 0.161905442024385 |
| 2001 | 0.4687642 | 0.5232378 | 0.4622103 | 0.3103448 | 0.0110527 | 0.2379687 | 0.1051317 | 0.4878203 | 22.427417 | 93.23109 | 0.268984011059863 |
| 2002 | 0.4533525 | 0.5549299 | 0.4547232 | 0.1739130 | 0.0084564 | 0.9734252 | 0.0919588 | 0.9866231 | 20.284167 | 177.79238 | -0.0398685290282559 |
| 2003 | 0.4676550 | 0.4234178 | 0.4640520 | 0.1997354 | 0.0063801 | 0.3164717 | 0.0798756 | 0.5625582 | 17.080022 | 132.86126 | 0.438317746922696 |
| 2004 | 0.5119103 | 0.5040861 | 0.5103588 | 0.2132035 | 0.0077798 | 0.3149368 | 0.0882033 | 0.5611923 | 17.230219 | 111.32866 | 0.28451811587725 |
| 2005 | 0.4999405 | 0.5703421 | 0.4938106 | 0.2696970 | 0.0086835 | 0.5972410 | 0.0931855 | 0.7728137 | 18.639314 | 135.50004 | 0.259972759535036 |
| 2006 | 0.5095186 | 0.3780734 | 0.5019330 | 0.2132035 | 0.0092455 | 0.1543951 | 0.0961535 | 0.3929315 | 18.871440 | 103.92994 | 0.214364846836437 |
| 2007 | 0.5122600 | 0.3417329 | 0.5230112 | 0.1396104 | 0.0106894 | 0.1949886 | 0.1033898 | 0.4415751 | 20.183061 | 129.21646 | -0.0779291007130322 |
| 2008 | 0.5230419 | 0.4870805 | 0.5189547 | 0.2555781 | 0.0114339 | 0.4033530 | 0.1069294 | 0.6351008 | 20.443759 | 130.38928 | 0.0709927981245744 |
| 2009 | 0.5470468 | 0.3498635 | 0.5520338 | 0.2111111 | 0.0083628 | 0.1661192 | 0.0914486 | 0.4075772 | 16.716773 | 116.49606 | 0.214699356785296 |
| 2010 | 0.5420497 | 0.4451815 | 0.5374252 | 0.1861472 | 0.0067794 | 0.3929646 | 0.0823370 | 0.6268689 | 15.189936 | 140.81199 | 0.149682900186965 |
| 2011 | 0.5567867 | 0.4550168 | 0.5583801 | 0.2330317 | 0.0070287 | 0.3199414 | 0.0838376 | 0.5656336 | 15.057402 | 124.31049 | 0.110723452628601 |
| 2012 | 0.5856565 | 0.4274122 | 0.5772817 | 0.1818182 | 0.0117385 | 0.5733445 | 0.1083442 | 0.7571951 | 18.499608 | 177.15803 | 0.118505097420617 |
| 2013 | 0.5839650 | 0.3574324 | 0.5830854 | 0.2000000 | 0.0077910 | 0.1919021 | 0.0882668 | 0.4380663 | 15.115085 | 122.55919 | 0.174298304821679 |
| 2014 | 0.5835797 | 0.2922095 | 0.5905414 | 0.1291667 | 0.0097295 | 0.1594706 | 0.0986381 | 0.3993377 | 16.902251 | 136.66144 | 0.00865609822575021 |
| 2015 | 0.6174168 | 0.1964900 | 0.6224206 | 0.1052632 | 0.0087879 | 0.0505793 | 0.0937439 | 0.2248985 | 15.183248 | 114.45798 | -0.085144224657118 |
| 2016 | 0.6487894 | 0.2433334 | 0.6299171 | 0.1380952 | 0.0079146 | 0.0795301 | 0.0889638 | 0.2820109 | 13.712272 | 115.89484 | 0.073082626755754 |
##### ---------------------------------------------------------------------------------------
conceito_f <- factor(ds_COR$CD_CONCEITO_PROGRAMA) ## Fator para split de categoria
ds_COR_conceito <- ds_COR %>% select(CD_CONCEITO_PROGRAMA,IMI,IPT) %>%
split(conceito_f, drop = T) %>% ## Separação por conceito
map(f.corr) ## Calculo de correlação para cada segmento
ds_COR_conceito <- f.print_corr(ds_COR_conceito)
ds_COR_conceito <- ds_COR %>% group_by(CD_CONCEITO_PROGRAMA) %>%
summarise(m_IMI = mean(IMI), #|
m_IPT = mean(IPT), #| Média
md_IMI = median(IMI), #|
md_IPT = median(IPT), #| Mediana
v_IMI = var(IMI), #|
v_IPT = var(IPT), #| Variancia
d_IMI = sd(IMI), #|
d_IPT = sd(IPT), #| Devio padrão
pc_IMI = (d_IMI/m_IMI)*100, #|
pc_IPT = (d_IPT/m_IPT)*100) %>% #| Percentual do desvio padrão sobre valor esperado
merge(., ds_COR_conceito, by.x = "CD_CONCEITO_PROGRAMA", by.y = "cat", all = T) %>%
mutate(ANO_INICIO_PROGRAMA = as.character(CD_CONCEITO_PROGRAMA))
write.csv2(ds_COR_conceito, paste0(v_path_o, "COR_conceito.csv"))
kable(ds_COR_conceito)| CD_CONCEITO_PROGRAMA | m_IMI | m_IPT | md_IMI | md_IPT | v_IMI | v_IPT | d_IMI | d_IPT | pc_IMI | pc_IPT | cor | ANO_INICIO_PROGRAMA |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3 | 0.5743336 | 0.3882774 | 0.5735221 | 0.1889881 | 0.0088175 | 0.2771818 | 0.0939016 | 0.5264805 | 16.34966 | 135.5939 | 0.055026960698169 | 3 |
| 4 | 0.4898355 | 0.4006425 | 0.4813126 | 0.1875000 | 0.0102660 | 0.2880815 | 0.1013214 | 0.5367323 | 20.68478 | 133.9679 | 0.124621962513638 | 4 |
| 5 | 0.4379631 | 0.4080335 | 0.4234125 | 0.2272727 | 0.0094011 | 0.2500862 | 0.0969594 | 0.5000862 | 22.13871 | 122.5601 | 0.233147931165116 | 5 |
| 6 | 0.4085206 | 0.4454501 | 0.4006268 | 0.2105263 | 0.0059685 | 0.5214046 | 0.0772561 | 0.7220835 | 18.91120 | 162.1020 | 0.229689141936706 | 6 |
| 7 | 0.3860605 | 0.4442528 | 0.3944808 | 0.2857143 | 0.0040430 | 0.2875101 | 0.0635844 | 0.5361997 | 16.47008 | 120.6970 | -0.141432750904144 | 7 |
##### ---------------------------------------------------------------------------------------
dependencia_f <- factor(ds_COR$DS_DEPENDENCIA_ADMINISTRATIVA) ## Fator para split de categoria
ds_COR_dependencia <- ds_COR %>% select(DS_DEPENDENCIA_ADMINISTRATIVA,IMI,IPT) %>%
split(dependencia_f, drop = T) %>% ## Separação por dependencia
map(f.corr) ## Calculo de correlação para cada segmento
ds_COR_dependencia <- f.print_corr(ds_COR_dependencia)
ds_COR_dependencia <- ds_COR %>% group_by(DS_DEPENDENCIA_ADMINISTRATIVA) %>%
summarise(m_IMI = mean(IMI), #|
m_IPT = mean(IPT), #| Média
md_IMI = median(IMI), #|
md_IPT = median(IPT), #| Mediana
v_IMI = var(IMI), #|
v_IPT = var(IPT), #| Variancia
d_IMI = sd(IMI), #|
d_IPT = sd(IPT), #| Devio padrão
pc_IMI = (d_IMI/m_IMI)*100, #|
pc_IPT = (d_IPT/m_IPT)*100) %>% #| Percentual do desvio padrão sobre valor esperado
merge(., ds_COR_dependencia, by.x = "DS_DEPENDENCIA_ADMINISTRATIVA", by.y = "cat", all = T)
write.csv2(ds_COR_dependencia, paste0(v_path_o, "COR_dependencia.csv"))
kable(ds_COR_dependencia)| DS_DEPENDENCIA_ADMINISTRATIVA | m_IMI | m_IPT | md_IMI | md_IPT | v_IMI | v_IPT | d_IMI | d_IPT | pc_IMI | pc_IPT | cor |
|---|---|---|---|---|---|---|---|---|---|---|---|
| PRIVADA | 0.5565106 | 0.5258685 | 0.5639965 | 0.2500 | 0.0114146 | 0.4881934 | 0.1068392 | 0.6987084 | 19.19806 | 132.8675 | 0.178122050939056 |
| PÚBLICA | 0.4892672 | 0.3755529 | 0.4821972 | 0.1875 | 0.0123382 | 0.2510658 | 0.1110773 | 0.5010647 | 22.70280 | 133.4205 | 0.0263052063561273 |
##### ---------------------------------------------------------------------------------------
area_f <- factor(ds_COR$NM_AREA_AVALIACAO) ## Fator para split de categoria
ds_COR_area <- ds_COR %>% select(NM_AREA_AVALIACAO,IMI,IPT) %>%
split(area_f, drop = T) %>% ## Separação por area
map(f.corr) ## Calculo de correlação para cada segmento
ds_COR_area <- f.print_corr(ds_COR_area)
ds_COR_area <- ds_COR %>% group_by(NM_AREA_AVALIACAO) %>%
summarise(m_IMI = mean(IMI), #|
m_IPT = mean(IPT), #| Média
md_IMI = median(IMI), #|
md_IPT = median(IPT), #| Mediana
v_IMI = var(IMI), #|
v_IPT = var(IPT), #| Variancia
d_IMI = sd(IMI), #|
d_IPT = sd(IPT), #| Devio padrão
pc_IMI = (d_IMI/m_IMI)*100, #|
pc_IPT = (d_IPT/m_IPT)*100) %>% #| Percentual do desvio padrão sobre valor esperado
merge(., ds_COR_area, by.x = "NM_AREA_AVALIACAO", by.y = "cat", all = T) %>%
merge(., ds_siglas, by.x = "NM_AREA_AVALIACAO", by.y = "nome")
ds_COR_area <- ds_COR_area[,c(13,1:12)]
write.csv2(ds_COR_area, paste0(v_path_o, "COR_area.csv"))
kable(ds_COR_area)| sigla | NM_AREA_AVALIACAO | m_IMI | m_IPT | md_IMI | md_IPT | v_IMI | v_IPT | d_IMI | d_IPT | pc_IMI | pc_IPT | cor |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ADM | ADMINISTRAÇÃO PÚBLICA E DE EMPRESAS, CIÊNCIAS CONTÁBEIS E TURISMO | 0.5620398 | 0.2917656 | 0.5610366 | 0.1538462 | 0.0075094 | 0.1310885 | 0.0866570 | 0.3620614 | 15.41830 | 124.09325 | 0.0476104511873025 |
| ANTR | ANTROPOLOGIA / ARQUEOLOGIA | 0.4980210 | 0.1428420 | 0.5040662 | 0.1111111 | 0.0058061 | 0.0082209 | 0.0761979 | 0.0906690 | 15.30013 | 63.47502 | 0.749293103047719 |
| ARQU | ARQUITETURA, URBANISMO E DESIGN | 0.5410553 | 0.3775596 | 0.5254354 | 0.2222222 | 0.0128116 | 0.1167852 | 0.1131882 | 0.3417384 | 20.91990 | 90.51246 | 0.228470267879311 |
| ARTE | ARTES / MÚSICA | 0.5516364 | 0.1386445 | 0.5476228 | 0.0869565 | 0.0059821 | 0.0138663 | 0.0773443 | 0.1177553 | 14.02089 | 84.93329 | -0.192058733444528 |
| AFIS | ASTRONOMIA / FÍSICA | 0.3720471 | 0.2030266 | 0.3470100 | 0.1176471 | 0.0081098 | 0.0728485 | 0.0900544 | 0.2699045 | 24.20511 | 132.94049 | 0.0119246929132408 |
| BIOD | BIODIVERSIDADE | 0.4582678 | 0.1957734 | 0.4227550 | 0.0833333 | 0.0082425 | 0.1288887 | 0.0907880 | 0.3590107 | 19.81112 | 183.38072 | 0.295262699689729 |
| BIOT | BIOTECNOLOGIA | 0.5758725 | 1.3448461 | 0.5520550 | 1.0909091 | 0.0091047 | 1.7229868 | 0.0954185 | 1.3126259 | 16.56938 | 97.60417 | -0.00554813139594037 |
| CCOMP | CIÊNCIA DA COMPUTAÇÃO | 0.4841066 | 0.5598763 | 0.4700014 | 0.2679487 | 0.0079290 | 0.4543501 | 0.0890451 | 0.6740549 | 18.39370 | 120.39354 | 0.337467928208708 |
| CALIM | CIÊNCIA DE ALIMENTOS | 0.5021606 | 0.7402905 | 0.4871369 | 0.5227273 | 0.0103970 | 0.6915660 | 0.1019658 | 0.8316045 | 20.30542 | 112.33488 | -0.0403955659825708 |
| CPOL | CIÊNCIA POLÍTICA E RELAÇÕES INTERNACIONAIS | 0.5706356 | 0.2703117 | 0.6011555 | 0.0769231 | 0.0112490 | 0.1944076 | 0.1060613 | 0.4409168 | 18.58652 | 163.11419 | 0.695604623035731 |
| CAGRI | CIÊNCIAS AGRÁRIAS I | 0.4685310 | 0.3349835 | 0.4551695 | 0.2023810 | 0.0103009 | 0.1057914 | 0.1014932 | 0.3252559 | 21.66200 | 97.09610 | 0.0146855324584208 |
| CAMB | CIÊNCIAS AMBIENTAIS | 0.6104526 | 0.2730628 | 0.6142941 | 0.1428571 | 0.0027458 | 0.1012756 | 0.0524001 | 0.3182383 | 8.58381 | 116.54400 | 0.101881176227336 |
| CBI | CIÊNCIAS BIOLÓGICAS I | 0.4994095 | 0.6764019 | 0.4574387 | 0.4544288 | 0.0082982 | 0.8660853 | 0.0910944 | 0.9306370 | 18.24042 | 137.58641 | 0.184803797634397 |
| CBII | CIÊNCIAS BIOLÓGICAS II | 0.4800129 | 0.3875768 | 0.4446935 | 0.2490323 | 0.0074435 | 0.1451255 | 0.0862758 | 0.3809535 | 17.97365 | 98.29110 | 0.234924344471354 |
| CBIII | CIÊNCIAS BIOLÓGICAS III | 0.4878419 | 0.6002489 | 0.4727768 | 0.3193277 | 0.0092568 | 0.3476269 | 0.0962121 | 0.5895989 | 19.72199 | 98.22574 | 0.0569042555913723 |
| 31 | COMUNICAÇÃO E INFORMAÇÃO | 0.5620376 | 0.3069668 | 0.5578070 | 0.1666667 | 0.0042517 | 0.2089877 | 0.0652052 | 0.4571517 | 11.60158 | 148.92546 | 0.246482775951791 |
| DIRE | DIREITO | 0.3803537 | 0.1007436 | 0.3493296 | 0.0697115 | 0.0119161 | 0.0090767 | 0.1091607 | 0.0952719 | 28.69978 | 94.56875 | 0.157456957260575 |
| ECON | ECONOMIA | 0.5388506 | 0.6710695 | 0.5235912 | 0.1666667 | 0.0077229 | 1.4496067 | 0.0878802 | 1.2039962 | 16.30882 | 179.41452 | -0.126549526038425 |
| EDUC | EDUCAÇÃO | 0.4759315 | 0.1211216 | 0.4621334 | 0.0544118 | 0.0054563 | 0.0519690 | 0.0738666 | 0.2279671 | 15.52042 | 188.21347 | 0.108495142616859 |
| EFIS | EDUCAÇÃO FÍSICA | 0.4404994 | 0.1322053 | 0.4219032 | 0.0741758 | 0.0053630 | 0.0189253 | 0.0732328 | 0.1375693 | 16.62494 | 104.05729 | 0.312763495211669 |
| ENFEE | ENFERMAGEM | 0.4104475 | 0.2768576 | 0.4042974 | 0.1458333 | 0.0070782 | 0.1164755 | 0.0841323 | 0.3412851 | 20.49769 | 123.27097 | 0.0422589007123443 |
| ENGI | ENGENHARIAS I | 0.5082287 | 0.2780807 | 0.4928614 | 0.1875000 | 0.0127769 | 0.0725829 | 0.1130349 | 0.2694121 | 22.24096 | 96.88271 | -0.150114518151716 |
| ENGII | ENGENHARIAS II | 0.4978308 | 0.6893837 | 0.4832882 | 0.5454545 | 0.0130447 | 0.2998964 | 0.1142132 | 0.5476279 | 22.94218 | 79.43731 | 0.0120803910601318 |
| ENGIII | ENGENHARIAS III | 0.5386601 | 0.6849478 | 0.5276911 | 0.4894366 | 0.0120338 | 0.3509995 | 0.1096988 | 0.5924521 | 20.36512 | 86.49594 | 0.154503858375922 |
| ENGIV | ENGENHARIAS IV | 0.4781398 | 0.5768609 | 0.4836177 | 0.4555556 | 0.0108588 | 0.2564211 | 0.1042058 | 0.5063803 | 21.79400 | 87.78206 | 0.0192612715664114 |
| ENSI | ENSINO | 0.5749583 | 0.1809241 | 0.5758972 | 0.1254902 | 0.0098342 | 0.0377002 | 0.0991676 | 0.1941655 | 17.24779 | 107.31875 | 0.190844121027246 |
| FARM | FARMÁCIA | 0.5197188 | 0.7597380 | 0.5424709 | 0.5000000 | 0.0076871 | 0.7112891 | 0.0876759 | 0.8433796 | 16.86988 | 111.00927 | -0.404644793024165 |
| FILO | FILOSOFIA | 0.4429540 | 0.1050189 | 0.4225003 | 0.0954545 | 0.0065252 | 0.0036803 | 0.0807785 | 0.0606655 | 18.23631 | 57.76626 | -0.162549279239194 |
| GEOC | GEOCIÊNCIAS | 0.4527815 | 0.1585391 | 0.4555833 | 0.0769231 | 0.0125462 | 0.0230186 | 0.1120098 | 0.1517187 | 24.73816 | 95.69798 | 0.405008849152875 |
| GEOG | GEOGRAFIA | 0.4477785 | 0.1288647 | 0.4231340 | 0.0690476 | 0.0069278 | 0.0337183 | 0.0832334 | 0.1836254 | 18.58808 | 142.49479 | 0.42112430417687 |
| HIST | HISTÓRIA | 0.4230407 | 0.0615002 | 0.3639525 | 0.0526316 | 0.0175621 | 0.0004780 | 0.1325221 | 0.0218638 | 31.32609 | 35.55079 | 0.72297555450312 |
| INTE | INTERDISCIPLINAR | 0.6160689 | 0.3661844 | 0.6154952 | 0.2000000 | 0.0076114 | 0.2293859 | 0.0872436 | 0.4789425 | 14.16134 | 130.79272 | -0.0483086851346577 |
| LETR | LETRAS / LINGUÍSTICA | 0.4530650 | 0.1543771 | 0.4536374 | 0.0833333 | 0.0094282 | 0.0426180 | 0.0970991 | 0.2064412 | 21.43160 | 133.72528 | 0.396897366952718 |
| MAFE | MATEMÁTICA / PROBABILIDADE E ESTATÍSTICA | 0.4266529 | 0.0757409 | 0.3903368 | 0.0540936 | 0.0072326 | 0.0019527 | 0.0850446 | 0.0441890 | 19.93298 | 58.34240 | 0.370084361579298 |
| MATE | MATERIAIS | 0.5812343 | 0.6337145 | 0.5674261 | 0.4062500 | 0.0138905 | 0.3292804 | 0.1178581 | 0.5738296 | 20.27721 | 90.55018 | -0.0383173535471925 |
| MEDI | MEDICINA I | 0.4560494 | 0.2770991 | 0.4540817 | 0.1363636 | 0.0037100 | 0.2067886 | 0.0609097 | 0.4547401 | 13.35595 | 164.10743 | -0.0924197992666254 |
| MEDII | MEDICINA II | 0.4910419 | 0.3171799 | 0.4907244 | 0.1428571 | 0.0042239 | 0.2028259 | 0.0649916 | 0.4503620 | 13.23544 | 141.98947 | 0.0293568314694279 |
| MEDIII | MEDICINA III | 0.4385964 | 0.3411829 | 0.4163677 | 0.1764706 | 0.0057189 | 0.2135701 | 0.0756236 | 0.4621364 | 17.24218 | 135.45121 | 0.388063865105932 |
| MVET | MEDICINA VETERINÁRIA | 0.4277576 | 0.3388667 | 0.4136139 | 0.2142857 | 0.0088083 | 0.1057207 | 0.0938525 | 0.3251472 | 21.94057 | 95.95138 | -0.248999125290204 |
| NUTR | NUTRIÇÃO | 0.4986630 | 0.3465697 | 0.5101044 | 0.2019231 | 0.0033505 | 0.1953373 | 0.0578834 | 0.4419698 | 11.60772 | 127.52697 | 0.151123497676553 |
| ODON | ODONTOLOGIA | 0.3941684 | 0.4031381 | 0.3722371 | 0.2187500 | 0.0101509 | 0.2269797 | 0.1007518 | 0.4764238 | 25.56059 | 118.17883 | 0.0754209833253817 |
| PLUR | PLANEJAMENTO URBANO E REGIONAL / DEMOGRAFIA | 0.6283042 | 0.1105020 | 0.6400658 | 0.0916667 | 0.0097094 | 0.0038744 | 0.0985361 | 0.0622450 | 15.68286 | 56.32925 | 0.288840618566875 |
| PSICO | PSICOLOGIA | 0.3965791 | 0.2108548 | 0.3722954 | 0.1250000 | 0.0053732 | 0.0502826 | 0.0733019 | 0.2242377 | 18.48356 | 106.34700 | 0.362981794343675 |
| QUIM | QUÍMICA | 0.4007854 | 0.4722336 | 0.3733165 | 0.4128788 | 0.0101856 | 0.1374670 | 0.1009238 | 0.3707654 | 25.18150 | 78.51313 | -0.228144024553952 |
| SCOL | SAÚDE COLETIVA | 0.5451550 | 0.1261340 | 0.5496062 | 0.0869565 | 0.0069515 | 0.0124490 | 0.0833758 | 0.1115750 | 15.29396 | 88.45750 | -0.345486417056443 |
| SSOC | SERVIÇO SOCIAL | 0.4603859 | 0.1166667 | 0.4603859 | 0.1166667 | 0.0426334 | 0.0005556 | 0.2064787 | 0.0235702 | 44.84905 | 20.20305 | -1 |
| SOCI | SOCIOLOGIA | 0.5021918 | 0.0726852 | 0.5562162 | 0.0625000 | 0.0097549 | 0.0005716 | 0.0987667 | 0.0239088 | 19.66712 | 32.89363 | 0.396736564144396 |
| ZOOT | ZOOTECNIA / RECURSOS PESQUEIROS | 0.4346320 | 0.1785424 | 0.4340551 | 0.0833333 | 0.0058195 | 0.0535519 | 0.0762854 | 0.2314129 | 17.55173 | 129.61227 | -0.0598526351728995 |
##### ---------------------------------------------------------------------------------------
status_f <- factor(ds_COR$CS_STATUS_JURIDICO) ## Fator para split de categoria
ds_COR_status <- ds_COR %>% select(CS_STATUS_JURIDICO,IMI,IPT) %>%
split(status_f, drop = T) %>% ## Separação por status
map(f.corr) ## Calculo de correlação para cada segmento
ds_COR_status <- f.print_corr(ds_COR_status)
ds_COR_status <- ds_COR %>% group_by(CS_STATUS_JURIDICO) %>%
summarise(m_IMI = mean(IMI), #|
m_IPT = mean(IPT), #| Média
md_IMI = median(IMI), #|
md_IPT = median(IPT), #| Mediana
v_IMI = var(IMI), #|
v_IPT = var(IPT), #| Variancia
d_IMI = sd(IMI), #|
d_IPT = sd(IPT), #| Devio padrão
pc_IMI = (d_IMI/m_IMI)*100, #|
pc_IPT = (d_IPT/m_IPT)*100) %>% #| Percentual do desvio padrão sobre valor esperado
merge(., ds_COR_status, by.x = "CS_STATUS_JURIDICO", by.y = "cat", all = T)
write.csv2(ds_COR_status, paste0(v_path_o, "COR_status.csv"))
kable(ds_COR_status)| CS_STATUS_JURIDICO | m_IMI | m_IPT | md_IMI | md_IPT | v_IMI | v_IPT | d_IMI | d_IPT | pc_IMI | pc_IPT | cor |
|---|---|---|---|---|---|---|---|---|---|---|---|
| ESTADUAL | 0.4859979 | 0.3282292 | 0.4849812 | 0.1550481 | 0.0112001 | 0.1656389 | 0.1058305 | 0.4069876 | 21.77592 | 123.99496 | 0.0560431910218089 |
| FEDERAL | 0.4897049 | 0.3913628 | 0.4798593 | 0.2000000 | 0.0125776 | 0.2798879 | 0.1121501 | 0.5290443 | 22.90157 | 135.18002 | 0.013503440641843 |
| MUNICIPAL | 0.5626099 | 0.3537739 | 0.5584018 | 0.2583333 | 0.0268984 | 0.1029824 | 0.1640073 | 0.3209087 | 29.15116 | 90.71011 | 0.794949069461493 |
| PARTICULAR | 0.5565106 | 0.5258685 | 0.5639965 | 0.2500000 | 0.0114146 | 0.4881934 | 0.1068392 | 0.6987084 | 19.19806 | 132.86750 | 0.178122050939056 |
##### ---------------------------------------------------------------------------------------
modalidade_f <- factor(ds_COR$NM_MODALIDADE_PROGRAMA) ## Fator para split de categoria
ds_COR_modalidade <- ds_COR %>% select(NM_MODALIDADE_PROGRAMA,IMI,IPT) %>%
split(modalidade_f, drop = T) %>% ## Separação por modalidade
map(f.corr) ## Calculo de correlação para cada segmento
ds_COR_modalidade <- f.print_corr(ds_COR_modalidade)
ds_COR_modalidade <- ds_COR %>% group_by(NM_MODALIDADE_PROGRAMA) %>%
summarise(m_IMI = mean(IMI), #|
m_IPT = mean(IPT), #| Média
md_IMI = median(IMI), #|
md_IPT = median(IPT), #| Mediana
v_IMI = var(IMI), #|
v_IPT = var(IPT), #| Variancia
d_IMI = sd(IMI), #|
d_IPT = sd(IPT), #| Devio padrão
pc_IMI = (d_IMI/m_IMI)*100, #|
pc_IPT = (d_IPT/m_IPT)*100) %>% #| Percentual do desvio padrão sobre valor esperado
merge(., ds_COR_modalidade, by.x = "NM_MODALIDADE_PROGRAMA", by.y = "cat", all = T)
write.csv2(ds_COR_modalidade, paste0(v_path_o, "COR_modalidade.csv"))
kable(ds_COR_modalidade)| NM_MODALIDADE_PROGRAMA | m_IMI | m_IPT | md_IMI | md_IPT | v_IMI | v_IPT | d_IMI | d_IPT | pc_IMI | pc_IPT | cor |
|---|---|---|---|---|---|---|---|---|---|---|---|
| ACADÊMICO | 0.4879121 | 0.3860063 | 0.4798593 | 0.1875000 | 0.0120277 | 0.2666483 | 0.1096709 | 0.5163800 | 22.47760 | 133.7750 | 0.0460688884333034 |
| PROFISSIONAL | 0.5876662 | 0.5096381 | 0.5848819 | 0.2352941 | 0.0094136 | 0.4798977 | 0.0970239 | 0.6927465 | 16.51003 | 135.9291 | 0.153973846826859 |
f.mplot <- function(ds, label) {
#### Base -------------------------------------------
GGCor <- ggplot(data = ds, aes(x = ds[,1])) +
geom_col(aes(y = (as.double(cor)*100)),
width = 0.9,
alpha=0.4,
#stat = "sum",
col = "black",
size = 0.5
) +
scale_y_continuous(breaks = seq(-100, 100, by = 10)) +
geom_hline(yintercept = 0, col = 'black', alpha = 0.7) +
geom_hline(yintercept = 30, col = 'orange', alpha = 0.7, size = 1.5) +
geom_hline(yintercept = 60, col = 'green', alpha = 0.7, size = 1.5) +
geom_point(aes(y = (as.double(cor)*100)),
size=1.8, shape=21, fill="black") +
geom_text(aes(y = (as.double(cor)*100) + ifelse(as.double(cor) > 0, 6, -6),
label = format(as.double(cor), digits = 4)),
size = 4) +
theme_light() +
theme(axis.text.x = element_text(angle = 45,
vjust = 1,
size = 9,
hjust = 1)) +
labs(title = 'Correlação por Categoria', x = paste0('Categoria (_', label, '_)'), y = 'Corr * 100') +
geom_bar(aes(y = as.double(m_IMI)*100),
position = position_nudge(x = -0.225),
width = 0.35, alpha=0.25,
fill = "blue",
stat = "sum",
size = 1) +
geom_bar(aes(y = as.double(m_IPT)*100),
position = position_nudge(x = 0.225),
width = 0.35, alpha=0.25,
fill = "red",
stat = "sum",
size = 1)
return(GGCor)
}
cat("Gráfico de exemplo para referÊncia")## Gráfico de exemplo para referÊncia
g_legenda <- f.mplot(ds_COR_dependencia, "Dependencia") +
geom_label(aes(x = 2.55, y = 62, label = 'Correlação alta'),
col = 'green', hjust = 'right', alpha = 0.5, size=4) +
geom_label(aes(x = 2.55, y = 32, label = 'Correlação média'),
col = 'orange', hjust = 'right', alpha = 0.5, size=4) +
geom_label(aes(x = 0.6, y = 56, label = 'Média de IMI'),
col = 'blue', hjust = 'left', alpha = 0.5, size=4) +
geom_label(aes(x = 2.05, y = 13, label = 'Média de IPT'),
col = 'red', hjust = 'left', alpha = 0.5, size=4) +
geom_label(aes(x = 1, y = 19.9, label = 'Correlação'),
col = 'black', hjust = 'left', alpha = 0.5, size=4)
print(g_legenda)## Gráficos por categoria
f.histo <- function(ds){
#### Histograma por categoria pelo GGPlot2 -------------
GGHis <- ggplot(ds,aes(ds[,2])) +
stat_bin(aes(y =..density..,
fill = ..count..),
col = "black",
binwidth = 0.05,
alpha = 0.8) +
geom_density(fill = "red",
color = "orange",
alpha = 0.11) +
scale_x_continuous(breaks = seq(0, 1, by = 0.05)) +
#scale_y_continuous(labels = NULL) +
labs(title = paste0('Histograma de ', v_idx, " - ", v_categ, " - ", ds[1,1]) , x = v_idx, y = 'Contagem') +
scale_fill_distiller(name = 'Observações',
palette = v_pal,
direction = 1);GGHis
}
v_categ <- "Área de Avaliação"
v_idx <- "IPT"
v_pal <- 'YlGnBu'
ds_COR %<>% merge(., ds_siglas, by.x = "NM_AREA_AVALIACAO", by.y = "nome")
ds_cat_P <- ds_COR %>% select(sigla, IPT) %>%
split(as.factor(.$sigla)) %>%
map(f.histo);
v_idx <- "IMI"
v_pal <- 'YlGn'
ds_cat_D <- ds_COR %>% select(sigla, IMI) %>%
split(as.factor(.$sigla)) %>%
map(f.histo);
for(i in seq_along(ds_cat_P)){
print(ds_cat_P[[i]])
print(ds_cat_D[[i]])
}v_categ <- "Conceito do Programa"
v_idx <- "IPT"
v_pal <- 'YlGnBu'
ds_cat_P <- ds_COR %>% select(CD_CONCEITO_PROGRAMA, IPT) %>%
split(as.factor(.$CD_CONCEITO_PROGRAMA)) %>%
map(f.histo);
v_idx <- "IMI"
v_pal <- 'YlGn'
ds_cat_D <- ds_COR %>% select(CD_CONCEITO_PROGRAMA, IMI) %>%
split(as.factor(.$CD_CONCEITO_PROGRAMA)) %>%
map(f.histo);
for(i in seq_along(ds_cat_P)){
print(ds_cat_P[[i]])
print(ds_cat_D[[i]])
}#####------------------------------------------------------------------------------------------
v_categ <- "Status Jurídico"
v_idx <- "IPT"
v_pal <- 'YlGnBu'
ds_cat_P <- ds_COR %>% select(CS_STATUS_JURIDICO, IPT) %>%
split(as.factor(.$CS_STATUS_JURIDICO)) %>%
map(f.histo);
v_idx <- "IMI"
v_pal <- 'YlGn'
ds_cat_D <- ds_COR %>% select(CS_STATUS_JURIDICO, IMI) %>%
split(as.factor(.$CS_STATUS_JURIDICO)) %>%
map(f.histo);
for(i in seq_along(ds_cat_P)){
print(ds_cat_P[[i]])
print(ds_cat_D[[i]])
}#####------------------------------------------------------------------------------------------
v_categ <- "Dependência Administrativa"
v_idx <- "IPT"
v_pal <- 'YlGnBu'
ds_cat_P <- ds_COR %>% select(DS_DEPENDENCIA_ADMINISTRATIVA, IPT) %>%
split(as.factor(.$DS_DEPENDENCIA_ADMINISTRATIVA)) %>%
map(f.histo);
v_idx <- "IMI"
v_pal <- 'YlGn'
ds_cat_D <- ds_COR %>% select(DS_DEPENDENCIA_ADMINISTRATIVA, IMI) %>%
split(as.factor(.$DS_DEPENDENCIA_ADMINISTRATIVA)) %>%
map(f.histo);
for(i in seq_along(ds_cat_P)){
print(ds_cat_P[[i]])
print(ds_cat_D[[i]])
}#####------------------------------------------------------------------------------------------
v_categ <- "Modalidade do Programa"
v_idx <- "IPT"
v_pal <- 'YlGnBu'
ds_cat_P <- ds_COR %>% select(NM_MODALIDADE_PROGRAMA, IPT) %>%
split(as.factor(.$NM_MODALIDADE_PROGRAMA)) %>%
map(f.histo);
v_idx <- "IMI"
v_pal <- 'YlGn'
ds_cat_D <- ds_COR %>% select(NM_MODALIDADE_PROGRAMA, IMI) %>%
split(as.factor(.$NM_MODALIDADE_PROGRAMA)) %>%
map(f.histo);
for(i in seq_along(ds_cat_P)){
print(ds_cat_P[[i]])
print(ds_cat_D[[i]])
}